package org.huhu.mercury.common;

import java.io.IOException;
import org.apache.commons.lang3.StringUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

/**
 * jsoup 对html文本进行操作|jsoup_alter增加了xhtml的转换返回
 */
public class JsoupUtil {

	/**
	 * 返回html里的显示文本
	 * @param strHtml
	 * @return
	 */
	public static String getText(String strHtml) {
		Document doc = Jsoup.parse(strHtml);
		return doc.text();
	}

	/**
	 * 返回标准的html文本
	 * @param strHtml
	 * @return
	 */
	public static String getHtml(String strHtml) {
		Document doc = Jsoup.parse(strHtml);
		return doc.html();
	}

	/**
	 * 得到百度短地址。
	 * @param url
	 * @return
	 */
	public static String getBaiduShortUrl(String url) {
		String doc = "";
		try {
			doc = Jsoup.connect("http://dwz.cn/create.php").timeout(10000).data("url", url).post().text();
		} catch (IOException e) {
			e.printStackTrace();
		}
		return doc;
	}

	public static String noScriptStr(String str) {
		if (StringUtils.isNotBlank(str)) {
			Element body = Jsoup.parse(str).body();
			body.getElementsByTag("script").remove();
			str = body.html();
		}
		return str;
	}

}
